
Brainfuck のベンチで AI が満点を取った、けれど「8 8」で正体が割れた話|EsoLang-Bench を Codex CLI で再現して見た、カンニングと本物の境目
難解言語ベンチ EsoLang-Bench を Codex CLI(gpt-5.5)で再現し、Brainfuck の Easy を3条件で測りました。答えを見せると満点でも未知入力「8 8」で空を返すカンニング、答えを隠しても満点だが本物、Medium は全条件0%。同じ100%の中身が正反対だった記録です。









